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摘 要 【目的 ] 通 过 梳理 国际 代表 性 数据 期 刊 特 点 ,更 好 地 了 解数 据 期 刊 发 展 的 趋势 和 特征 。【 方 法 】 选 择 15 种 数据 期 刊 
进行 调研 ,对 其 发 展现 状 、 学科 分 布 、 出 版 方式 \ 收 录 内 容 、 引 用 机 制 \ 版 权 协 议 以 及 出 版 费用 等 方面 进行 了 分 析 。 【结果 】 基 
于 Scientific Data、F1000 Research、GigaScience 等 代表 性 期 刊 的 分 析 , 成 功 的 数据 期 刊 特 点 包括 科研 人 员 的 认 知 度 、 学 术 社 群 
的 认可 度 、 知 识 产权 保护 以 及 管理 透明 化 。【 结 论 ] 中 国 数据 期 刊 出 版 界 在 搭建 数据 知识 库 和 数据 期 刊 出 版 平台 后 ,还 需 关 
注 如 何 提升 国际 认 知 度 和 认可 度 ; 图 书馆 员 除 了 为 科研 人 员 推 荐 这 些 开 放 获 取 的 数据 资源 外 ,更 重要 的 是 协助 他 们 鉴别 良 
好 的 数据 期 刊 ,以 保护 他 们 的 知识 产权 权益 。 
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三 伴随 着 数据 密集 型 科研 活动 的 于 勃发 展 ,有 一 
生动 愈 来 愈 受 重视 一 -支撑 关键 发 现 的 数据 被 
更 多 的 人 访问 ,从 而 促进 了 数据 的 进一步 分 析 以 及 
缚 时 的 验证 "“。 科 学 数据 不 仅仅 是 被 研究 的 对 
多 其 作为 科研 活动 的 主要 产品 ”finst class 
plsghcts" 已 经 得 到 认可 2 。 在 此 环境 下 ,数据 其 
HKaata journal) 也 快速 发 展 起 来 。 尤 其 是 近年 来 ， 
除开 放 获 取出 版 商 Biomed Central 推出 了 数据 期 刊 
BMG Research Notes 外 ,许多 大 型 传统 出 版 社 也 相继 
推 草 了 数据 期 刊 。 如 施 普 林 格 集团 于 2012 年 推出 
的 5pringerPlus ,是 一 本 跨 学 科 的 综合 性 开放 获取 期 
刊 ; 其 出 版 对 象 为 原创 研究 、 典 型 案例 研究 和 研究 
方法 的 描述 性 文档 以 及 数据 论文 和 大 数据 集 ; Wiley 
集团 于 2012 年 推出 了 Geoscience Data Journal, 用 于 
发 表 地 球 科学 数据 论文 ,并 通过 数字 对 象 标 识 符 


论文 的 产生 背景 、 概 念 ` 权 益 管 理 等 问题 进行 了 探 
讨 , 并 提 到 了 两 种 典型 的 数据 期 刊 ” 。 本 文 则 对 现 
有 的 数据 期 刊 进行 了 调研 ,六 选 部 分 具有 代表 性 的 
数据 期 刊 ,分 析 了 数据 期 刊 的 学 科 属 性 、 出 版 方式 、 
收录 内 容 . 引 用 机 制 \ 版 权 协议 、 费 用 等 特点 ,指出 
了 数据 期 刊 的 优势 和 面临 的 挑战 。 


1 国际 数据 期 刊 发 展现 状 


数据 期 刊 大 致 可 分 为 两 种 ,一 种 是 纯粹 的 数据 
期 刊 , 其 出 版 对 象 全 部 为 数据 论文 , 如 Scientific 
Data、 Earth System Science Data、 Open Health Data 
等 ; 男 一 种 是 综合 性 的 数据 期 刊 ,出 版 数据 论文 的 
同时 也 出 版 综述 、 人 研究 论文 .会 议 报告 等 其 他 类 型 
的 文献 , 如 SpringerPlus, Biodiversity Data Journal, 
GigaScience 等 。 而 数据 论文 (data paper) 是 指 按照 


(DOI) 将 数据 论文 与 存放 在 数据 知识 库 中 的 数据 集 
关联 起 来 ;自然 出 版 集团 2014 年 出 版 的 Scientific 
Daia 旨 在 帮助 科研 人 员 发 布 、 发现 和 重用 研究 数 
据 , 该 杂志 中 一 个 重要 的 文章 类 型 是 “数据 描述 ” 
(Data Descriptor) ,用 于 描述 有 科学 价值 的 数据 集 ， 
并 帮助 作者 出 版 有 科学 价值 和 可 重用 性 的 数据 集 。 
在 国内 关于 数据 出 版 的 研究 中 , 刘 凤 红 等 人 对 数据 
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点 建设 ( 院 1522)。 


学 术 规 范 正 式 出 版 的 ,可 被 检索 的 元 数据 文件 ,用 
以 描述 单个 或 一 组 可 在 线 访问 的 数据 集 ": 。 数 据 
论文 的 内 容 主要 是 对 数据 采集 获取、 处 理 等 过 程 
和 方法 的 描述 ,不 涉及 对 数据 和 研究 结果 的 分 析 、 
推论 ,发现 以 及 假设 论证 ,其 目的 是 让 科研 群体 更 
好 地 发 现 、 获 取 、 理 解 与 复 用 数据 ,并 再 次 进行 科研 
创新 7 -3 。 本 文 参 考 Dyrad 网 站 中 的 线索 ,核实 和 
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总 结 国际 上 已 经 开展 数据 出 版 的 期 刊 共 85 种 (网 
站 更 新 日 期 2014 -10 -10) ,调研 了 15 种 目前 正式 
出 版 的 数据 期 刊 ,如 表 1 所 示 。 

所 调研 的 数据 期 刊 , 均 有 代表 性 ,例如 :BioMed 
Central 出 版 社 在 2008 年 较 早 进行 了 探索 性 试验 ， 
出 版 了 开放 获取 期 刊 BMC Research Notes 等 ,而 国际 


著名 学 术 出 版 商 Springer Nature、Wiley Elsevier 等 
也 随后 纷纷 推出 了 数据 期 刊 。 从 数据 期 刊 出 现 的 
时 间 可 以 看 出 , 自 2012 年 起 数据 期 刊 进入 发 展 高 峰 
期 。 在 开放 获取 的 数据 期 刊 中 , 尤 以 SpringerPlus、 
下 1000 Research .BMC Research Notes 等 出 版 了 大 量 的 
数据 论文 。 


表 1 国际 重要 数据 期 刊 的 基本 信息 


年 度 期 刊 名 称 出 版 商 发 文 总 量 (篇 ) 
2009 Earth System Science DataLl0] 1866 -3508 Copernicus Publications 108 
1999 Ecology-data paperlt!!] 0012 - 9658 Ecological Society of America 107 
2014 Genomics DataLD1 2213 -5960 Elsevier 89 
2013 Dataset Papers in Sciencel !’] 2314 - 8497 Hindawi publishing 51 
2014 Scientific Datal | 2052 - 4436 Nature Publication Group 37 
2008 BMC Research NoiesL51 1756 -0500 BoiMed Central 35 
2009 International Journal of Robotics Researcht!®] 1741 -3176 SAGE publications 13 
2012 Journal of Open Archaeology Datal!"!| 2049 - 1565 Ubiquity Press 13 
2013 Open Health Datal!s| 2054 -7102 Ubiquity Press 12 
2012 GigaSciencel!’] 2047 -217X BoiMed Central 11 
2012 F1000 Research' ”| 2046 - 1402 F1000 Research 10 
2013 Biodiversity Data Journall?!! 1314 -2828 Pensoft Publishers 9 
2013 Journal of Open Psychology Data!™)| 2050 — 9863 Ubiquity Press 7 
2014 Geoscience Data Journall®] 2049 -6060 Wiley Online Library 6 
2014 SpringerPlaus[24] 2193 -1801 Springer 1 


注 : 年 度 " 指 首次 出 版 数据 论文 时 间 ;数量 指 发 表 数 据 论 文 的 数量 ,和 


2 国际 数据 期 刊 特点 分 析 


本 文 对 调研 的 15 种 期 刊 从 学 科 属 性 、 出 版 方 
式 \ 收 录 内 容 要 求 .引用 机 制版 权 协 议 、 费 用 等 方 
面 进行 分 析 。 
2.1 学 科 分 布 

生命 科学 领域 ( 含 医学 ) 的 数据 期 刊 发 展 较 
早 ,期 刊 种 类 较 多 ,比较 著名 的 数据 期 刊 共有 6 
种 ,分 别 是 Genomics Data、BMC Research Notes、 
F1000 Research GigaSciencel "| Open Health Data 
和 Biodiversity Data Journal。 属 于 地 球 科学 的 数 
据 期 刊 有 Earth System Science Data 和 Geoscience 
Data Journal 等 。 其 它 学 科 类 别 的 数据 期 刊 还 包 
括 生态 学 、 心 理学 、 计 算 机 科学 以 及 考古 学 等 。 数 
据 期 刊 也 有 包含 多 个 学 科 的 综合 性 期 刊 , 比较 著 
名 的 有 三 种 ,分 别 是 Scientific Data、Dataset Papers 
in Science 以 及 SpringerPlus 等 。 刘 峰 等 人 对 
databib 上 注册 的 数据 知识 库 进 行 了 学 科 属 性 分 
析 , 发 现 生物 学 方面 的 数据 知识 库 数 量 最 多 ,这 
可 能 是 生命 科学 领域 数据 期 刊 发 展 较 快 的 原因 之 


438 http://www. cjstp. cn 


位 为 篇 ,统计 时 间 为 2014 年 11 月 2 日 。 


一 。 从 出 版 数据 论文 的 时 间 来 看 ,生态 学 期 刊 
Ecology 早 在 1999 年 就 开始 出 版 数据 论文 。 该 刊 
的 数据 论文 作为 一 种 特有 的 论文 形式 (data paper 
栏目 ) ,用 以 发 表 该 领域 的 大 数据 集 以 及 描述 大 数 
据 集 内 容 、 背景 结构、 质量 的 元 数据 信息 。 地 球 
学 科 的 数据 期 刊 出 版 形式 均 为 数据 论文 , 其 中 
2009 年 正式 出 版 的 Earth System Science Data 发 
表 数 据 论 文 的 数量 最 多 。 
2.2 出 版 方式 

当前 国际 重要 数据 期 刊 普遍 采取 开放 获取 的 
方式 正式 出 版 (期 刊 Ecology 虽然 不 是 开放 获取 期 
刊 , 但 其 所 有 数据 论文 均 可 在 线 获取 ) ,以 便于 科学 
数据 最 大 程度 的 传播 和 复 用 。 在 笔者 所 调查 的 数 
据 期 刊 中 , 均 采 用 同行 评审 机 制 ,以 保证 期 刊 内 容 
的 质量 以 及 可 用 性 。 与 传统 的 期 刊 不 同 ,大 部 分 数 
据 期 刊 仅 以 在 线 的 方式 出 版 (E-Only) ,少数 期 刊 同 
时 发 行 了 纸 本 和 电子 版 。 而 在 出 版 周期 上 ,若干 数 
据 期 刊 打破 了 按 年 、 季 、 月 、 周 等 固定 周期 出 版 的 模 
式 ,作者 的 数据 论文 只 要 通过 同行 评审 , 即 可 随时 
在 线 发 表 , 笔 者 整理 如 表 2 所 示 。 
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表 2 国际 重要 数据 期 刊 的 比较 


国 出 版 载体 出 版 周期 
期 刊 名 称 正式 出 版 。 同行 评审 ”开放 获取 
在 线 纸 质 随时 年 月 
Biodiversity Data Journal @ @ @ @ @ 
Dataset Papers in Science @ @ @ @ @ 
F1000 Research @ @ @ @ @ 
GigaScience @ @ @ @ @ 
Journal of Open Archaeology Data @ 全 3 【3 @ 
Journal of Open Psychology Data @ @ @ @ @ 
Open Health Data @ @ @ @ @ 
Scientific Data @ @ @ @ @ 
SpringerPlus @ @ @ @ @ 
Farth System Science Data @ @ @ @ @ @ 
Genomics Data @ @ @ @ @ 
BMC Research Notes @ @ @ @ @ 
Geoscience Data Journal @ @ @ @ @ 
Ecology-datapaper @ @ @ © @ @ 
International Journal of Robotics Research @ @ @ @ @ @ 
2.3 ”收录 内 容 表 3 ”数据 期 刊 的 收录 内 容 的 具体 要 求 
从 数据 期 刊 收录 的 内 容 和 范围 看 ,以 数据 论文 为 、 
主要 形式 的 期 刊 ,即使 有 少数 其 他 类 型 的 文章 ,其 内 期 刊 收录 范围 RN 
容 也 与 数据 处 理 \ 数 据 服务 等 相关 。 如 GigaScience oe 要 求 在 数据 知识 库 注册 
、 ~ 十 六 PA En 六 J 和 未 要 求 
主要 发 表 数 据 文献 和 一 些 介绍 云 计 算 、 大 数据 领域 软 ee 
件 与 工具 的 文章 ;而 Geoscience Data Journal 主要 发 数据 保存 期 刊 自 带 数据 知识 库 
表 数据 论文 以 及 关于 数据 服务 和 数据 出 版 最 佳 实践 期 和 指定 才 所 知识 
的 文章 。 另 一 类 以 数据 论文 作为 子 栏目 之 一 的 期 刊 ， 数据 保存 仓储 的 开放 性 守 可 对 交合 让 


其 收录 范围 除了 数据 论文 外 ,还 包括 综述 、 研 究 论文 、 
临床 实验 文章 、 观 察 文章 .观点 文章 、 研 究 记录 、 案 例 
报告 等 ,最 具 代 表 性 的 如 BMC Research Notes、F1000 
Research .SpringerPlIus 等 。 

从 数据 来 源 看 ,大 部 分 期 刊 中 数据 论文 的 来 源 
既 可 以 是 对 已 发 表 论文 中 数据 的 说 明 描 述 ,也 可 以 
是 对 新 产生 数据 的 说 明 描 述 。 当 数据 集 较 大 时 , 需 
要 先 到 指定 或 者 推荐 的 数据 知识 库 上 将 数据 集注 
册 , 并 将 注册 后 的 链接 、 标 识 符 、 元 数据 等 信息 放 到 
数据 论文 中 。 存 放 数 据 集 的 数据 知识 库 也 必须 具 
有 开放 共享 性 质 ,以 保证 数据 集 随 时 能 够 被 访问 和 
获取 。 此 外 ,有 的 期 刊 还 开发 了 自己 的 数据 知识 
库 , 如 GigaScience 期 刊 中 的 数据 集 存放 在 该 出 版 社 
开发 的 Giga DB 数据 知识 库 "” 中 。 这 些 具体 要 求 ， 
笔者 整理 如 表 3 所 示 。 
2.4 引用 规范 

所 有 期 刊 都 有 明确 的 引用 要 求 ,并 给 出 了 引用 
示例 。 如 Nature 出 版 的 Scientific Data, 其 引用 格式 


包 仿 作者、 题目、 期 刊 . 卷 \ 文 草 号 ,DOI 号、 年代, 具 
体 示例 为 : 
Falkenberg, K. J. et al. 


functional genomic and transcriptomic analyses for 


Genome-wide 


genes regulating sensitivity to vorinostat. Sci. Data 
1:140017 doi: 10. 1038/sdata. 2014. 17 (2014)”'”! 

笔者 所 调查 的 数据 期 刊 均 采 用 数字 对 象 标 
识 符 (DOI) 对 其 数据 论文 进行 唯一 标识 。 在 这 
些 数据 期 刊 中 ,有 10 种 数据 期 刊 在 其 引用 要 求 
中 明确 列 出 需要 将 DOI 标识 符 作 为 引用 字段 。 
而 其 他 5 种 数据 期 刊 则 未 做 此 要 求 ,其 中 Earth 
System Science Data 期 刊 仅 将 DOI 作为 Persistent 
ID( 永 久 标 识 ) 字段 的 选择 之 一 ; BMC Research 
Notes .GigaScience .Dataset Papers in Science 用 期 
刊 中 内 部 编码 (如 :article number) 对 引用 文献 进 
行 标识 ;而 Dataset Papers in Science 则 未 提 及 唯 
一 标识 符 。 
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2.5 版 权 协 议 
除 Ecology 的 数据 论文 未 提 及 作者 版 权 归 属 
外 ,其 余 的 期 刊 均 提 到 作者 保留 对 其 数据 论文 的 著 
作 权 合法 权利 。 而 从 出 版 协议 看 ,数据 期 刊 的 主流 
形式 是 采用 “知识 共享 许可 协议 ”( Creative 
Commons License, 又 称 创作 共用 许可 ,简称 CC ) 31 
作为 许可 协议 。 采 用 知识 共享 许可 协议 的 期 刊 中 ， 
Scientific Data、 F1000 Research Biodiversity Data 
Journal 等 采用 最 新 版 的 CC 4.0'”。 而 Scientific 
Data 与 Genomics Data 等 还 可 以 由 作者 自行 选择 开 
放 层 度 不 同 的 许可 方式 ,如 署名 共享 (CC BY 4. 0) 、 
署名 - 非 商 业 性 使 用 共享 (CC BY-NC 4.0)、 署 名 
- 非 商 业 性 使 用 - 以 相同 方式 共享 (CC BY-NC-SA 
4.0)。Biodiversity Data Journal 除了 采用 CC 以 外 ， 
其 出 版 的 科学 数据 还 需 遵照 开放 数据 共享 署名 许 
可 (Open Data Commons Attribution License ) [301 。 
早期 的 数据 期 刊 有 采用 该 出 版 社 自己 设置 的 许可 
协议 ,例如 BMC Research Notes 早先 采用 了 Biomed 
Central 出 版 条 款 , 后 来 随 着 整个 出 版 社 并 入 
Springer 集团 ,并 且 在 积极 推进 开放 获取 出 版 的 战 
影响 下 , 改 为 CC 协议 。 出 现 类 似 情况 的 还 有 
ACS 出 版 协议 SAGE 出 版 协议 等 。 由 此 可 见 ,国外 
数据 期 刊 的 授权 许可 是 在 摸索 中 前 进 , 可 供 我 国 出 

版 界 借鉴 参考 。 

2.6 出 版 费用 
除了 Dataset Papers in Science、 GigaScience. 
Biodiversity Data Journal 三 种 期 刊 以 外 ,笔者 所 调 
查 的 数据 期 刊 大 多 要 求 文 付 数据 出 版 费 (Data 
Publishing Charge，DPC ) ,类 似 论文 处 理 费 (APC ) 。 
传统 大 型 出 版 社 的 数据 期 刊 出 版 费用 较 高 , 如 
Nature 的 Scientific Data 期 刊 ,如 果 选 择 CC 4.0 授 
权 许 可 , 则 作者 需 文 付 人 民 币 6850 元 ; Wiley 的 
Geoscience Data Journal 期 刊 需 要 作者 支付 1500 美 
元 ;BioMed Central 的 BMC Research Notes 期 刊 需 
要 作者 支付 1255 美元 。 而 一 些 新 兴 的 出 版 社 , 如 
Ubiquity Press 出 版 的 四 种 数据 期 刊 则 只 是 象征 性 
收取 25 英镑 , 且 如 果 作 者 无 项 目 资助 ,还 可 以 申请 
费用 免除 。 同 样 可 以 申请 费用 免除 的 还 有 Elsevier 
集团 出 版 的 Genomics Data 期 刊 。 值 得 注意 的 是 ， 
许多 目前 免费 的 期 刊 都 说 明了 免费 的 期 限 ,因此 收 
取 一 定 的 出 版 费用 应 该 是 未 来 数据 期 刊 的 发 展 趋 
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势 。 我 国 作者 和 科研 人 员 在 投稿 时 ,往往 以 发 表 论 
文 作为 第 一 考虑 ,对 其 中 的 “知识 产权 转让 ”问题 和 
“出 版 费用 支付 ”问题 可 能 不 太 理 解 或 者 难以 理解 ， 
这 方面 有 待 图 书馆 员 进 行 相 关 培 训 和 推广 宣传 。 


3 数据 期 刊 实例 分 析 


为 求 深入 理解 一 些 已 经 成 功 的 数据 期 刊 案例 ， 
笔者 仔细 分 析 了 由 科研 人 员 所 推荐 曾经 投稿 的 数 
据 期 刊 。 整 理 如 下 : 

3.1 Scientific Data 

该 刊 是 Nature 集团 2013 年 推出 的 综合 性 开放 
获取 期 刊 ,该 刊 主要 以 数据 论文 为 主导 ,数据 论文 
发 表 在 其 重要 的 文章 类 型 “数据 描述 ”( Data 
Descriptor) 栏 目下 ,发表 后 的 数据 论文 被 收录 到 一 
些 重要 的 索引 服务 中 被 传播 和 重用 。 该 刊 提 出 了 
六 个 关键 原则 ,这 些 原 则 也 很 好 地 概括 了 当前 科研 
环境 对 数据 期 刊 发 展 的 要 求 : 

1) 信用 :通过 一 个 可 被 引用 的 出 版 物 ,储备 和 
分 享 研 究 数据 。 

2) 重用 :完整 ,组织 化 标准 化 的 描述 ,保证 数 
据 可 被 重用 。 

3) 质量 :严格 以 学 术 团体 为 基础 的 同行 评审 

4) 发 现 :找到 与 研究 相关 的 数据 集 。 

5) 开放 :在 数据 使 用 .重用 和 分 布 上 促进 和 文 
持 开 放 的 科学 原则 ,通过 知识 共享 许可 协议 获取 。 

6) 服务 :数据 描述 进行 内 部 管理 和 快速 同行 
评审 。 
3.2 F1000 Research 

F1000 Research 是 2012 年 开始 启动 的 一 个 综 
合 性 的 在 线 开放 获取 期 刊 ,也 是 当前 出 版 界 创 新 模 
式 的 典型 代表 。 主 要 发 表 生 命 科 学 和 医学 领域 的 
新 进展 、 新 发 现 、 科 学 数据 、 工 具 软 件 等 ,出 版 物 类 
型 包括 数据 论文 ,综述 、 研 究 论文 .案例 报告 .临床 
实践 文章 、 软 件 工具 、 观 点 性 文 草 等 14 种 。 其 特点 
如 下 : 

1) 发 表 数据 论文 : 发 表 数 据 或 数据 论文 是 
F1000 Research 的 一 个 重要 特色 ,数据 可 以 与 研究 
论文 一 起 发 表 , 也 可 以 单独 以 数据 论文 的 形式 发 
表 , 数 据 集 可 保存 在 Dryad Figshare 等 与 之 合作 的 
数据 知识 库 中 。 

2) 发 表 速 度 快 :没有 固定 的 出 版 周期 ,投稿 经 
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过 简单 的 语言 和 格式 审查 后 , 立刻 公开 发 布 在 该 网 
站 上 ,并 标记 为 “等 待 同行 评审 (awaiting peer 
review)” ,同行 评审 通过 后 ,当天 或 第 二 天 即 正式 发 
表 在 该 期 刊 上 ,并 获得 一 个 DOI 标识 符 , 同 时 可 被 
scopus ,google scholar 等 检索 。 

3) 后 同行 评审 模式 :稿件 先 提交 在 网 站 上 公开 
发 布 ,然后 再 进行 同行 评审 ,同行 评审 的 结果 及 修 
改 意见 、 专 家 观点 等 实时 发 布 在 网 络 上 ,作者 可 以 
同 专家 进行 询问 、 解 释 、 准 论 。 

4) 过 程 公开 透明 :稿件 通过 简单 语言 和 格式 审 
核发 布 后 ,任何 人 都 可 以 查看 并 发 表 评 论 , 同行 评 
审 的 意见 .与 作者 的 交流 讨论 以 及 每 次 修改 后 的 稿 
件 等 都 公布 在 网 站 上 。 

3.3 GigaScience 

是 由 华 大 基因 和 BoiMed Central 联合 创办 , 面 
向 所 有 使 用 或 产 出 海量 数据 的 生物 学 研究 者 的 开 
放 阅 读 期 刊 。 

1) 文献 与 数据 库 结合 :期 刊 具 有 与 之 相关 联 的 
GIGA DB 数据 库 ,用 于 存放 GigaScience 期 刊 提 到 
的 数据 集 和 工具 。 研 究 者 在 查看 数据 论文 的 时 候 
可 以 直接 利用 数据 集 以 及 工具 进行 研究 的 重 现 与 
论证 。 

2) 数据 标识 :GIGA DB 数据 库 采用 DOI 标识 
符 对 期 刊 中 的 所 有 数据 进行 标识 ,使 数据 保存 更 加 
永久 ,实现 可 追踪 、 可 检索 、 可 链接 、 可 引用 。 

3) 免费 发 表 : 到 目前 为 止 ,用 户 在 该 期 刊 发 表 
以 及 在 对 应 数据 库 里 对 数据 注册 都 无 需 支 付费 用 。 
3.4 Earth System Science Data 

Earth System Science Data 于 2009 年 开始 出 版 
地 球 科学 相关 数据 ,是 一 个 以 出 版 数据 论文 为 主导 
且 强 调 数 据 原创 性 的 数据 期 刊 。 稿 件 可 先 通过 简 
单 快速 的 同行 评审 发 表 在 Earth System Science 
Data discussion 论坛 上 (该 论坛 也 注册 有 ISSN 号 ， 
并 能 形成 正式 引用 ) ,面向 所 有 研究 者 开放 并 接受 
评论 。 竺 稿件 正式 通过 同行 评审 后 , 则 发 表 在 Earth 
System Science Data 期 刊 上 。 


4 数据 期 刊 优势 及 挑战 

随 着 科研 第 四 范式 的 到 来 ,科研 环境 对 数据 开 
放 共 享 的 要 求 越 来 越 高 。 近 几 年 来 ,数据 期 刊 的 发 
展 越 来 越 快 ,各 大 传统 出 版 社 纷纷 推出 了 自己 的 数 


据 期 刊 。 结 合 前 文 对 其 特点 的 分 析 , 数 据 期 刊 在 数 
据 发 布 和 出 版 上 ,具有 一 些 显著 特点 : 

首先 ,数据 期 刊 以 开放 获取 作为 主流 的 出 版 趋 
势 ,同时 要 求 存放 数据 集 和 相关 工具 的 仓储 、 平 台 
也 具有 开放 性 ,以 保证 科研 群体 在 查看 数据 的 同时 
可 直接 获取 数据 和 工具 ,这 使 得 科学 数据 在 最 大 范 
围 内 得 以 传播 共享 和 复 用 。 

其 次 ,数据 期 刊 不 拘泥 于 固定 周期 的 出 版 方式 
以 及 新 颖 的 后 同行 评审 模式 提高 了 知识 的 传播 速 
度 。 数 据 提 前 公开 发 表 既 避免 了 其 他 研究 者 无 谓 
地 重复 ,也 使 得 这 些 数据 可 以 在 别人 的 研究 中 得 到 
验证 或 进行 新 的 发 现 ,这 些 特 点 使 得 科研 效率 大 幅 
度 提 高 。 

此 外 ,在 新 颖 的 后 同行 评审 (Post peer review ) 
模式 下 ,评审 意见 随同 数据 论文 一 起 发 布 ,作者 可 
以 进行 讨论 与 辩解 ,科研 群体 也 可 公开 发 表 评论 和 
观点 ,所 有 信息 的 公开 透明 使 得 研究 结果 更 加 客观 
与 公证 。 

更 重要 的 是 ,数据 期 刊 将 数据 以 正式 出 版 物 的 
形式 呈现 ,使 得 数据 更 规范 、 易 理解 、 可 引用 ,数据 
标识 符 的 采用 以 及 引用 机 制 的 建立 使 得 数据 生产 
者 的 贡献 得 以 体现 ,数据 的 知识 产权 归属 更 加 明 
晰 ,从 而 让 研究 者 愿意 共享 数据 ,促进 了 科学 数据 
的 共享 。 

如 果 把 数据 期 刊 放 在 “数据 发 布 与 出 版 "的 框 
架 下 ,理解 数据 期 刊 在 “数据 驱动 科研 (data driven 
research) "范式 中 的 作用 与 角色 ,那么 它们 的 发 展 优 
势 明显 。 然 而 ,数据 期 刊 可 能 尚未 到 达 发 展 成 熟 的 
阶段 ,体现 优势 的 同时 也 面临 着 一 些 挑 战 。 

4.1 数据 期 刊 认 知 度 

数据 期 刊 还 未 在 科研 群体 中 被 广泛 认 知 ,这 可 
从 调研 中 大 部 分 数据 期 刊 上 的 发 文 量 得 到 佐证 。 
在 我 国 ,数据 期 刊 尚 处 于 起 步 和 摸索 的 阶段 ，2014 
年 在 北京 怀柔 举办 的 科学 数据 大 会 上 ” ,中 科 院 地 
理科 学 与 资源 研究 所 提出 开始 发 行 数据 期 刊 4 地 理 
学 报 增刊 》。 这 是 我 国 第 一 本 数据 期 刊 ,介绍 有 重 
要 共享 价值 的 科研 数据 ,同时 配合 《全 球 变 化 科学 
研究 数据 注册 与 出 版 系统 》” 的 运行 ,将 数据 存储 
在 数据 知识 库 中 ,并 在 数据 期 刊 上 发 表 。 

但 是 ,考虑 到 学 术 社 群 通用 语言 上 的 劣势 、 考 
核 评价 上 关注 国外 期 刊 的 现实 情况 以 及 国内 科研 
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人 员 对 于 本 国 数据 期 刊 和 数据 知识 库 尚 未 熟悉 等 
各 种 条 件 , 若 要 在 我 国 出 版 界 推动 数据 期 刊 的 发 
展 , 可 以 考虑 结合 图 书馆 员 的 力量 ,提高 这 些 优 秀 
办 刊 刊 物 的 国内 认 知 度 , 以 期 在 未 来 能 够 争取 国际 
认 知 度 。 
4.2 数据 期 刊 认 可 度 

当前 科研 环境 还 缺乏 对 数据 期 刊 以 及 数据 论 
文 的 价值 评价 体系 。 尽 管 有 一 些 用 于 评价 数据 期 
刊 或 数据 论文 价值 的 新 技术 和 新 方法 出 现 , 如 
Thomson Reuters 集团 新 推出 的 数据 引用 索引 数据 
库 (Data citation index)5331 以 及 近 两 年 开始 尝试 的 
基于 文章 层面 的 影响 力 计 算 方 法 (Article Level 
Metrics) ”1 ,但 这 些 新 技术 新 方法 目前 仍 处 于 尝 
试 阶段 ,并 未 被 纳入 到 研究 者 成 果 评 价 体系 当中 。 
研究 者 的 成 果 无 法 像 期 刊 论文 一 样 ,用 期 刊 影响 因 
子 或 者 专家 的 评分 (F1000 Prime) ” 来 考量 和 计 
算 ,导致 其 贡献 力 和 影响 力 无 法 在 其 科研 共同 体内 
得 到 认可 和 体现 ,这 将 大 大 降低 研究 者 共享 和 发 表 
数据 的 积极 性 。 目 前 ,国外 已 就 这 个 问题 展开 各 项 
研究 与 试验 ,如 数据 级 别 计量 | 的 产生 和 推进 。 
4.3 知识 产权 保护 

数据 提供 者 和 数据 期 刊 在 科学 数据 开放 共享 
上 ,往往 通过 发 布 某 种 许可 协议 规范 来 引导 其 他 科 
研 人 员 如 何 使 用 .利用 和 重用 这 些 发 布 或 出 版 的 科 
学 数据 。 许 可 协议 的 适用 范围 是 在 著作 权 法 以 及 
邻接 权 的 框架 下 进行 ,不 同 的 许可 协议 有 其 适用 条 
件 和 历史 局 限 ,需要 随 着 数字 技术 发 展 . 科 学 社 群 
需求 . 认 知 的 变迁 以 及 法 律 法 规 和 机 构 政 策 的 调整 
而 作出 改变 。 目 前 通行 的 CC 协议 也 只 是 其 中 一 种 
途径 , 人 们 对 此 已 经 开展 了 许多 宣传 推广 
工作 '”-”3] 

数据 引用 在 一 定 程度 上 ,承认 科研 人 员 在 收 
集 `. 过滤、 清理、 整理、 提供 甚至 共享 科学 数据 上 对 
知识 创造 和 科学 进步 上 的 贡献 。 但 是 现 有 的 数据 
引用 方式 还 存在 一 定 的 局 限 ,为 了 激发 科学 数据 共 
享 价 值 的 最 大 潜力 ,人 们 正在 进行 一 系列 的 尝试 ， 
试图 从 数据 级 别 计量 等 的 工作 上 ,解决 只 能 通过 
DOI 或 者 数据 期 刊 才 能 进行 数据 出 版 和 引用 的 
局 限 。 

在 论 及 科学 数据 的 知识 产权 保护 时 ,人 们 容易 
将 著作 权限 制 与 例外 、 授 权 许可 、 数 据 引 用 进行 混 
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消 , 其 实 它们 属于 不 同 范畴 。 如 何 保护 科研 人 员 以 
及 科研 教育 机 构 在 国外 数据 期 刊 上 发 表 数 据 的 权 
益 , 使 其 明确 哪些 权利 应 该 转让 、 让 渡 与 转移 以 及 
哪些 权利 需要 保留 ,也 是 今后 需要 重点 考虑 的 问题 。 
4.4 运营 和 管理 

期 刊 的 运营 和 管理 需要 成 本 ,传统 期 刊 的 运营 
模式 是 一 种 由 读者 付费 的 运营 模式 ,但 传统 模式 也 
在 逐渐 转向 开放 获取 出 版 模式 。 对 数据 期 刊 而 
言 ,多 数 在 一 开始 就 采取 开放 获取 出 版 的 运营 机 
制 。 该 出 版 机 制 将 评审 费 、 编 辑 加 工 费 .出 版 费 、 行 
政 管理 费 等 成 本 计算 成 DPC 费用 ,要 求 作 者 及 其 所 
属 的 科研 教育 机 构 支 付 。 与 开放 获取 期 刊 评价 与 
六 选中 类 似 ,数据 期 刊 出 版 费 的 合理 与 否 ,要 看 它 
的 投入 成 本 与 计算 是 否 合理 ,而 这 方面 就 要 求 数据 
期 刊 的 管理 透明 化 。 数 据 期 刊 与 所 有 开放 获取 期 
刊 一 样 ,也 面临 着 对 其 运营 和 管理 模式 的 优化 调整 。 


5 结语 


数据 期 刊 作为 一 种 新 兴 的 出 版 形式 ,其 良好 的 
发 展 需要 科研 、 出 版 ,数据 服务 、 决 策 等 多 方 人 员 的 
共同 努力 。 出 版 者 、 数 据 服 务 者 需要 在 科研 群体 中 
扩大 数据 期 刊 的 认 知 度 ,让 更 多 的 研究 者 知晓 、 理 
解数 据 期 刊 的 实质 和 意义 。 
中 国 科 学 院 大 学 已 经 开设 了 相应 的 科学 数据 
管理 课程 ,围绕 科学 数据 生命 周期 中 的 数据 管理 、 
发 布 . 共 享 、 复 用 等 一 系列 问题 进行 了 讨论 ,让 越 来 
越 多 的 研究 者 了 解 到 数据 期 刊 。 这 将 有 助 于 未 来 
的 科研 人 员 能 够 充分 利用 和 识别 良好 的 数据 期 刊 。 

此 外 ,开发 新 技术 、 新 方法 建立 对 数据 期 刊 或 
数据 论文 的 引用 与 评价 机 制 , 同 时 梳理 与 科学 数据 
相关 的 一 系列 政策 也 很 有 必要 。 中 国 科 学 院 文 献 
情报 中 心 已 经 就 此 开展 一 系列 政策 研究 工作 ,从 科 
研 资助 机 构 、 科 研 教育 机 构 、 信 息 服 务 机 构 、 数 据 期 
刊 .数据 知识 库 .学 术 期 刊 的 数据 政策 等 ,有 系统 地 
梳理 政策 要 素 , 并 且 提 供 政策 编译 材料 在 机 构 知 识 
库 (ir. las. ac. cn) 上 开放 共享 。 

目前 由 于 种 种 因素 ,包括 国外 数据 期 刊 政 策 本 
身 的 不 明确 等 ,我 国 科 研 人 员 在 认识 “知识 产权 转 
让 ”和 “出 版 费用 支付 ”的 问题 上 ,可 能 存在 一 些 混 
淆 。 中 国 科学 院 文 献 情 报 中 心 的 科技 信息 政策 中 
心 已 经 开始 对 这 些 内 容 进 行 分 析 , 即 将 协同 学 科 馆 


欧阳 巍巍 ,等 . 国际 数据 期 刊 出 版 的 案例 分 析 及 其 特征 
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员 制 定 有 关 的 政策 调查 报告 及 最 佳 实践 指南 ,以便 
科研 人 员 更 加 清楚 地 了 解 。 

数据 出 版 者 则 需要 从 多 种 途径 来 优化 运营 管 
理 模 式 ,如 通过 外 部 赞助 .广告 植 和 人、 开展 增值 服务 
等 方式 来 减少 自身 运营 投入 ,在 最 大 程度 上 ,将 成 
本 文 出 与 收入 来 源 以 及 经 营 管理 予以 透明 化 ,在 提 
升 质量 管理 和 刊物 声誉 的 同时 ,让 收取 DPC 的 理由 
取信 于 人 。 总 之 ,只 有 通过 各 方 的 努力 和 实践 , 数 
据 期 刊 的 优势 才能 更 好 地 体现 ,从 而 更 好 地 推动 科 


人 研 的 发 展 。 

致谢 :感谢 中 国 科 学 院 文献 情报 中 心 初 景 利 教授 对 本 文 
的 指导 和 建议 。 
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An study on the case analysis and characteristics of 
international data journal publishing 


Ouyang Zhengzheng, QING Xiuling, KU Liping, WANG Hui, WU Ming 


National Science Library, CAS, 33 Beisihuan xilu, Beijing 100190,China 


Abstract: [Purpose |For better understanding the trends and features of the scientific data publishing and data journal development, 
this study focuses on the characteristics of the international representative data journals. [ Methodlogy | We select and survey 15 data 
Journals to analyze their development, subjects, publishing approaches, included contents, copyright agreements and publishing 
fees. [ Findings | Based on the survey of significant journals such as Scientific Data, F1000 Research and GigaScience, the 
characteristics of successful data journals include the researchers” awareness, the recognition in the scientific community, the 
protection of intellectual property rights, and the management transparency. [ Conclusions ] The Chinese data journal publishing 
should concern how to improve international awareness and recognition after building data repositories and data journal publishing 
platforms. The librarian can not only suggest researchers using those open access data resources, but also assistant them in 
identifying good data journals in order to protect their IP rights. 


Keywords: Data journal; Data article; Data publishing; Data citation; Copyright agreement 
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